Fechar

%0 Audiovisual Material
%4 sid.inpe.br/mtc-m16c/2020/11.05.16.59
%2 sid.inpe.br/mtc-m16c/2020/11.05.16.59.45
%T Deep learning e hashing para Content-Based Image Retrieval (CBIR) de imagens de sensoriamento remoto
%D 2020
%A Rodrigues, Marcos Lima,
%@affiliation Instituto Nacional de Pesquisas Espaciais (INPE)
%@electronicmailaddress marcos.rodrigues@inpe.br
%B Workshop dos Cursos de Computação Aplicada do INPE, 20 (WORCAP)
%C São José dos Campos
%8 8-11 e 14-17 set. 2020
%I Instituto Nacional de Pesquisas Espaciais (INPE)
%J São José dos Campos
%S Vídeos
%X A área de sensoriamento remoto (SR) para observação da Terra tem experimentado um grande desenvolvimento na última década. O acréscimo considerável do número de sensores aéreos e orbitais, assim como a evolução tecnológica empregada nesses equipamentos, causou um aumento expressivo do volume de dados gerados, inaugurando um novo paradigma o Remote Sensing Big Data (RSBD). Nesse contexto, uma das áreas de maior desafio é a de sistemas de busca e recuperação de imagens baseadas em conteúdo (Content-Based Image Retrieval CBIR). Tais sistemas empregam um grande número de descritores (vetor de atributos) de alta dimensão, onde a busca exaustiva é inviável devido ao custo computacional. Para enfrentar esse problema duas estratégias podem ser adotadas: i) melhorar os métodos de busca; ii) reduzir a dimensão dos descritores de atributos. Ultimamente, tem ganhado destaque na comunidade científica métodos de Hash profundo, ou seja, métodos que empregam redes neurais profundas para executar a extração de atributos de imagens e geração de códigos binários (Hash Codes) através de aprendizagem simultânea. Basicamente, durante o processo de aprendizagem os métodos mapeiam vetores de alta dimensão para um espaço de atributos de baixa dimensão conhecido como Hamming Space, onde os atributos das imagens são representados por Hash Codes que reduzem tanto complexidade computacional da busca e recuperação quanto o espaço de memória necessário para representação do conteúdo das imagens, aumentando assim a eficiência dessas tarefas. Nesse contexto, esse trabalho apresenta uma abordagem para CBIR no escopo do RSBD baseada na Metric-Learning based Deep Hashing Network (MiLaN). A MiLaN emprega à Inception V3, rede convolucional profunda, pré-treinada com o conjunto de imagens ImageNet (benchmark de Visão Computacional), o objetivo é obter um módulo padrão para extração de atributos de imagens, que são convertidos em Hash Codes para compor o espaço de atributos especializado para imagens de SR com base na função Triplet Loss proposta para o ajuste da MiLaN. O experimento foi conduzido sobre dois conjuntos de dados de SR: (i) UC Merced Land Use Dataset (UCMD) - conjunto de ortoimagens aéreas extraídas da coleção de mapeamento de áreas urbanas dos Estados Unidos; (ii) UCMD e Landsat Center Pivot Images (LCPI) - criado a partir da combinação do UCMD e amostras de imagens de áreas com pivôs obtidas com o Landsat 8. Visando à caracterização de áreas de interesse científico como, por exemplo, agricultura, floresta ou irrigadas por pivôs, foram realizadas buscas baseadas em conteúdo por meio do cálculo de similaridade, utilizando distância de Hamming, para recuperação de imagens num conjunto de 2200 imagens, alcançando desempenho global (mean Average Precision - mAP) de 91.40%, conseguindo efetivamente recuperar imagens relevantes para as classes agricultura e floresta e nem tão relevantes para a classe pivôs. Através do experimento realizado, foi possível demonstrar o potencial dessa abordagem para o desenvolvimento de sistemas CBIR que podem facilitar e viabilizar a busca por alvos, a fim de suportar à pesquisa de grupos temáticos como, por exemplo, SR para o monitoramento de áreas agrícolas ou irrigadas por pivôs.
%9 tecnologia da informação
%@language pt
%3 Deep Learning e hashing para CBIR de imagens de sensoriamento remoto - Marcos Lima Rodrigues.mp4
%O (16 min)


Fechar